Telegram Group & Telegram Channel
Заглянул на арену GPT. Если вы там не бываете, но интересуетесь борьбой GPTs - рекомендую заглядывать: [https://chat.lmsys.org/?leaderboard]

Интересные новости:
1. OpenAI все еще (или снова) лидирует, оставаясь единственной с ELO оценкой 1300+. Вообще каждый раз ощущение, что у них есть модель на порядок умнее, но релизить они ее будут только, когда другие покажут что-то достойное против текущей модели.
2. Впервые зашел в раздел тестов на русском языке – здесь Google сопоставим с OpenAI. Кто-нибудь знает, как было раньше?
3. Опенсорсные модели от Meta и Mistral близки к "прошлому" поколению моделей, которым 3-5 месяцев.

Про опенс сорс прикольно — эти модели требуют много вычислительных ресурсов, но и возможностей у них достаточно.
Также ждем полноценного релиза Grok 2 от Маска (последний раз оценка была 1281).

Вообще фан иногда "поиграть" в арену. Можно тут:
https://chat.lmsys.org/

И если вы не знаете как работает ELO score, короткое объяснение:
ELO рейтинг в LMSYS Chatbot Arena рассчитывается на основе парных баталий между моделями, где пользователи голосуют за лучшую, по их мнению, модель. После каждой баталии рейтинг моделей обновляется. Если модель с более высоким рейтингом проигрывает, она теряет больше очков, чем если бы выиграла.


@aihappens



tg-me.com/aihappens/337
Create:
Last Update:

Заглянул на арену GPT. Если вы там не бываете, но интересуетесь борьбой GPTs - рекомендую заглядывать: [https://chat.lmsys.org/?leaderboard]

Интересные новости:
1. OpenAI все еще (или снова) лидирует, оставаясь единственной с ELO оценкой 1300+. Вообще каждый раз ощущение, что у них есть модель на порядок умнее, но релизить они ее будут только, когда другие покажут что-то достойное против текущей модели.
2. Впервые зашел в раздел тестов на русском языке – здесь Google сопоставим с OpenAI. Кто-нибудь знает, как было раньше?
3. Опенсорсные модели от Meta и Mistral близки к "прошлому" поколению моделей, которым 3-5 месяцев.

Про опенс сорс прикольно — эти модели требуют много вычислительных ресурсов, но и возможностей у них достаточно.
Также ждем полноценного релиза Grok 2 от Маска (последний раз оценка была 1281).

Вообще фан иногда "поиграть" в арену. Можно тут:
https://chat.lmsys.org/

И если вы не знаете как работает ELO score, короткое объяснение:
ELO рейтинг в LMSYS Chatbot Arena рассчитывается на основе парных баталий между моделями, где пользователи голосуют за лучшую, по их мнению, модель. После каждой баталии рейтинг моделей обновляется. Если модель с более высоким рейтингом проигрывает, она теряет больше очков, чем если бы выиграла.


@aihappens

BY AI Happens





Share with your friend now:
tg-me.com/aihappens/337

View MORE
Open in Telegram


AI Happens Telegram | DID YOU KNOW?

Date: |

Start with a fresh view of investing strategy. The combination of risks and fads this quarter looks to be topping. That means the future is ready to move in.Likely, there will not be a wholesale shift. Company actions will aim to benefit from economic growth, inflationary pressures and a return of market-determined interest rates. In turn, all of that should drive the stock market and investment returns higher.

Launched in 2013, Telegram allows users to broadcast messages to a following via “channels”, or create public and private groups that are simple for others to access. Users can also send and receive large data files, including text and zip files, directly via the app.The platform said it has more than 500m active users, and topped 1bn downloads in August, according to data from SensorTower.AI Happens from ye


Telegram AI Happens
FROM USA